SequenceVariant
可以使用Haplotype
类型的构造函数直接获得变异信息。
Haplotype
类型存储了参考序列信息, 可以利用reconstruct
函数重建query序列:
提供 RawREF => NewREF
的比对结果, 就可以用translate
函数把变异切换到NewREF:
利用Variation
构造函数:
利用variations()
函数从Haplotype
中提取:
translate
函数也可以对Variation进行切换:
in
函数用于在Haplotype
中查找Variation
Variation | Ovis aires | Homo sapiens |
---|
C22T | true | false |
G29A | true | false |
C4A | false | true |
T13C | false | true |
C14A | false | true |
G17A | false | true |
C19A | false | true |
T20G | false | true |
G25T | false | true |
用变异构建新的单倍型
Edits
类型
Substitution
类型
Deletion
类型
Insertion
类型
变异发生的位置不存储在以上数据结构中。
Haplotype{S<:BioSequence,T<:BioSymbol}
记录了一系列变异的集合 构造函数:
当从Edit
和Variation
构造时, 从序列的第一个位置到最后一个位置依次引用, 因此必须始终按照位置对向量排序。
reference(h::Haplotype)
: 提取h的参考序列
variations(h::Haplotype{S,T}) where {S, T}
: 把h中的edits转变成Variation向量
reconstruct(h::"Haplotype)
: 重构query序列
translate(h::Haplotype{S,T}, aln::PairwiseAlignment{S,S}) where {S,T}
根据aln切换ref, 位于开头或结尾的INDEL可能无法保存。
Variation{S<:BioSequence,T<:BioSymbol}
包含ref和edit, 比
Edit
类型更稳健。
构造函数:
鼓励使用
variations(h)
的方式构造。